Oficina 4
CE II: GitHub
Carolina Musso
COEA/DEPAT/IPE-DF
Luiz Oliveira
DEPAT/IPE-DF
O Que é Reprodutibilidade na Ciência?
- Reprodutibilidade/Replicabilidade é a capacidade de obter resultados consistentes utilizando o mesmo método de pesquisa em experimentos ou estudos separados.
- É um pilar fundamental da ciência moderna, assegurando que descobertas possam ser verificadas e confiadas por outros pesquisadores.
- Reprodutibilidade/Replicabilidade envolve:
- Uso de métodos experimentais claros e bem documentados.
- Disponibilidade de dados e códigos utilizados para análise.
- Publicação transparente de resultados e processos
Entendendo a Crise de Reprodutibilidade
- A Crise de Reprodutibilidade refere-se à dificuldade crescente em replicar ou reproduzir resultados de pesquisas científicas em várias disciplinas.
- Causas da Crise:
- Pressão para Publicar: Cultura de “publicar ou perecer” pode incentivar resultados rápidos em detrimento da qualidade.
- Métodos Inadequados: Falta de detalhamento nos métodos experimentais que impede a reprodução precisa dos estudos.
- Manipulação de Dados: Em casos extremos, dados podem ser selecionados ou manipulados para produzir resultados desejados.
Escândalo da reproducibilidade
- Crise de repoducibilidade/replicabilidade
Introdução ao GitHub
- O GitHub é uma plataforma baseada na nuvem onde você pode armazenar, compartilhar e colaborar com outros para escrever código.
- Armazenar seu código em um “repositório” no GitHub permite:
- Exibir ou compartilhar seu trabalho.
- Acompanhar e gerenciar mudanças no seu código ao longo do tempo.
- Permitir que outros revisem seu código e façam sugestões para melhorá-lo.
- Colaborar em um projeto compartilhado, sem se preocupar que suas mudanças impactem o trabalho de seus colaboradores antes que você esteja pronto para integrá-las.
- A colaboração é uma das características fundamentais do GitHub, possibilitada pelo software de código aberto, Git, que é a base do GitHub.
- Existem alternativas, como GitLab e BitBucket. . . .
Sobre o Git
- Git é um sistema de controle de versão que rastreia inteligentemente as mudanças nos arquivos.
- É particularmente útil quando você e um grupo de pessoas estão fazendo mudanças nos mesmos arquivos ao mesmo tempo.
- Em um fluxo de trabalho baseado no Git, você normalmente:
- Cria uma ramificação a partir da cópia principal dos arquivos que você e seus colaboradores estão trabalhando.
- Faz edições de forma independente e segura na sua própria ramificação pessoal.
- Deixa o Git mesclar de forma inteligente suas mudanças de volta à cópia principal dos arquivos.
Como o Git e o GitHub Trabalham Juntos?
- Ao fazer upload de arquivos para o GitHub, você os armazena em um “repositório Git”.
- Há várias ações relacionadas ao Git que você pode completar diretamente no GitHub pelo seu navegador, como criar um repositório Git, criar ramificações, fazer upload e editar arquivos.
- A maioria das pessoas trabalha com seus arquivos localmente (em seu próprio computador), sincronizando continuamente essas mudanças locais e todos os dados relacionados ao Git com o repositório remoto central no GitHub.
Primeiros Passos e Próximos Passos
- Se você é novo no GitHub e não está familiarizado com o Git, recomenda-se começar pelos artigos na categoria “Comece sua jornada”.
- Esses artigos focam em tarefas que você pode completar diretamente no seu navegador no GitHub e ajudarão você a:
Linguagens de Programação e Reprodutibilidade
- Ferramenta Essencial para a análise de dados e visualização de grandes volumes de dados com precisão.
- Reprodutibilidade e Automatização: Scripts permitem que análises sejam replicadas por outros pesquisadores.
- Documentação e Transparência: Códigos bem documentados são cruciais para que outros verifiquem e entendam os métodos utilizados.
Outras vantagens do R (e do Python)
Gratuito e open source :
- Vai conseguir usar sempre.
Um grande processo colaborativo:
- O que você quiser fazer, alguém já tentou e vai te ajudar!
Não é uma “caixa preta”:
- você aprende mais com os erros.
“Conversa” com outras linguagens e ambientes:
- Latex, Markdown, html, python, Collab, GitHub, Overleaf…
REPRODUCIBILIDADE DAS SUAS ANÁLISES
- Bom pra você e bom para a ciência!
Comentários importantes
Você pode usar o Git por meio de:
Linha de comando : git terminal do RStudio
Interfaces gráficas: GitHub Desktop, Git Pane do RStudio.. .
Conectando o Github no RStudio
Boas práticas
- Caminho absoluto x Caminho relativo
- Embed-resources x Enviar todas as dependencias
- Trabalhar com projetos